אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

Σχετικά έγγραφα
פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

חורף תש''ע פתרון בחינה סופית מועד א'

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

ל הזכויות שמורות לדפנה וסטרייך

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

תרגול פעולות מומצאות 3

הסקה סטטיסטית/תקציר/תלמה לויתן

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

טושפ הרעשה ןחבמ t ןחבמ

תרגיל 13 משפטי רול ולגראנז הערות

תרגול מס' 6 פתרון מערכת משוואות ליניארית

תרגילים בנושא משתנה דמי:

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

gcd 24,15 = 3 3 =

x = r m r f y = r i r f

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

התפלגות χ: Analyze. Non parametric test

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

- הסקה סטטיסטית - מושגים

גבול ורציפות של פונקציה סקלרית שאלות נוספות

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

סיכום- בעיות מינימוםמקסימום - שאלון 806

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

אלגברה ליניארית (1) - תרגיל 6

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

קיום ויחידות פתרונות למשוואות דיפרנציאליות

מבוא לאקונומטריקה 57322

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

אלגברה מודרנית פתרון שיעורי בית 6

תרגול משפט הדיברגנץ. D תחום חסום וסגור בעל שפה חלקה למדי D, ותהי F פו' וקטורית :F, R n R n אזי: נוסחת גרין I: הוכחה: F = u v כאשר u פו' סקלרית:

{ : Halts on every input}

Logic and Set Theory for Comp. Sci.

מבוא לאקונומטריקה א' החוג לכלכלה

פתרונות , כך שאי השוויון המבוקש הוא ברור מאליו ולכן גם קודמו תקף ובכך מוכחת המונוטוניות העולה של הסדרה הנתונה.

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

תרגיל 7 פונקציות טריגונומטריות הערות

אלגברה ליניארית 1 א' פתרון 2

אינפי - 1 תרגול בינואר 2012

שאלה 1 V AB פתרון AB 30 R3 20 R

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

מודלים חישוביים תרגולמס 5

מתמטיקה בדידה תרגול מס' 5

גמישויות. x p Δ p x נקודתית. 1,1

בסל A רמת התועלת היא: ) - השקה: שיפוע קו תקציב=שיפוע עקומת אדישות. P x P y. U y P y A: 10>6 B: 9>7 A: 5>3 B: 4>3 C: 3=3 C: 8=8 תנאי שני : מגבלת התקציב

טענה חשובה : העתקה לינארית הינה חד חד ערכית האפס ב- הוא הוקטור היחיד שמועתק לוקטור אפס של. נקבל מחד חד הערכיות כי בהכרח.

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

PDF created with pdffactory trial version

(ספר לימוד שאלון )

לדוגמא : dy dx. xdx = x. cos 1. cos. x dx 2. dx = 2xdx לסיכום: 5 sin 5 1 = + ( ) הוכחה: [ ] ( ) ( )

x a x n D f (iii) x n a ,Cauchy

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

סדרות - תרגילים הכנה לבגרות 5 יח"ל

פתרון תרגיל 6 ממשוואות למבנים אלגברה למדעי ההוראה.

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

תדירות הנתונים, שנתיים,annual רבעונים quarterly וכו'. 5 ומשתנה Yהינו 3,6,9,5 ו- 7. נבחר, file-open data-import בשלב זה התוכנה

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

יווקיינ לש תוביציה ןוירטירק

אלגברה לינארית (1) - פתרון תרגיל 11

הרצאה תרגילים סמינר תורת המספרים, סמסטר אביב פרופ' יעקב ורשבסקי

אלגברה ליניארית 1 א' פתרון 7

שעה 0 חשיבה כמותית, שיטות מחקר כמותיות, רקע, כלי מחקר, מגבלות. שעה - 2 שיטות דגימה, דגימה אקראית, דגימה שיטתית ויעילות הדגימה.

דיאגמת פאזת ברזל פחמן

מתמטיקה בדידה תרגול מס' 12

פתרון תרגיל בית 6 מבוא לתורת החבורות סמסטר א תשע ז

קבוצה היא שם כללי לתיאור אוסף כלשהו של איברים.

הרצאה 7: CTMC הסתברויות גבוליות, הפיכות בזמן, תהליכי לידה ומוות

תשובות מלאות לבחינת הבגרות במתמטיקה מועד חורף תשע"א, מיום 31/1/2011 שאלון: מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן.

s ק"מ קמ"ש מ - A A מ - מ - 5 p vp v=

co ארזים 3 במרץ 2016

אלגברה א' - פתרונות לשיעורי הבית סמסטר חורף תשס"ט

TECHNION Israel Institute of Technology, Faculty of Mechanical Engineering מבוא לבקרה (034040) גליון תרגילי בית מס 5 ציור 1: דיאגרמת הבלוקים

שאלה 5: להלן סטטיסטיקה תיאורית מפורטת עם טבלת שכיחות לציוני בית ספר לוח 1: סטטיסטיקה תיאורית של ציוני בית ספר

החשמלי השדה הקדמה: (אדום) הוא גוף הטעון במטען q, כאשר גוף B, נכנס אל תוך התחום בו השדה משפיע, השדה מפעיל עליו כוח.

אלגברה לינארית 1 יובל קפלן

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

3-9 - a < x < a, a < x < a

אלגברה לינארית מטריצות מטריצות הפיכות

מבוא לאקונומטריקה ב' החוג לכלכלה [1]

פתרון תרגיל דוגמא מרחב המדגם הוא כל הקומבינציות של 20 חודשי הולדת. לכל ילד 12 אפשרויות,לכן. לכן -

מבני נתונים ויעילות אלגוריתמים

תורת הקבוצות תרגיל בית 2 פתרונות

הגדרה: מצבים k -בני-הפרדה

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

-107- גיאומטריה זוויות מבוא מטרתנו בפרק זה היא לחזור על המושגים שנלמדו ולהעמיק את הלימוד בנושא זה.

מתמטיקה בדידה תרגול מס' 2

Transcript:

009 אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע סיכום: דביר צנוע

הקדמה הדפים שלפניכם מהווים סיכום של קורס מבוא לאקונומטריקה, אשר הועבר באוניברסיטת תל- אביב ע"י ד"ר חמי גוטליבובסקי בסמסטר א' תש"ע. הסיכום הוקלד בידיי במהלך ההרצאות, ולא אושר על ידי גורמים אקדמיים באופן כללי או ד"ר גוטליבובסקי בפרט, ויש לקחת זאת בחשבון בעת הלמידה. הסיכום הינו כלי עזר בלבד ולא מחליף למידה פעילה וניהול מחברת מסודרת במהלך הקורס. אם מצאתם את השימוש במחברת מועיל אך זקוקים לעזרה נוספת, אני עומד לרשותכם, ומעביר שיעורים פרטיים בתשלום הכנה למבחן, עזרה בשיעורי בית והשלמת פערים. ליצירת קשר תוכלו לפנות אליי בפייסבוק, בדואר אלקטרוני dvirsmail@gmail.com או בטלפון.054-09558 זכרו: כלכלה זה כיף בסך הכל, אז תנו בראש. נ"ב: כמובן שאי אפשר ללמוד בלי מוסיקה, אז קבלו המלצה: http://www.youtube.com/watch?v=ijm68s5uais אז בהצלחה )ואתם תזדקקו לה(, דביר צנוע

תוכן עניינים... 5... 6... 6... 8.... 9... 11... 14... 14...... 15...... 17. חזרה על חוקי סטטיסטיקה חשובים הבנת התנהגות של יחידות כלכליות אומד הריבועים הפחותים β β התוחלת של השונות של הוכחת משפט גאוס מרקוב שימוש באומדים רווח סמך ל- β מבחני השערות האומד של α... 19 השונות המשותפת של α ו- β... 0 מודלים שאינם לינאריים בפרמטרים... 1 חיזוי... 3... 3... 4... 5...... 5... 6... 30 השפעת שינוי סקאלה על האומד מדד לאיכות הרגרסיה R הקשר בין R למקדם המתאם שינויים ב- R השוואת שתי רגרסיות רגרסיה מרובת משתנים מולטי קוליניאריות מושלמת... 31... 34... 35 מבחן F רגרסיה עם משתנה ריבועי טעויות ספציפיקציה... 37... 37... צורות שונות של משוואת הרגרסיה משתנים איכותיים... 40 מודל הכולל משתנים איכותיים עם משתנים כמותיים 3

... 41... 4... 4... 4...... 44 ריבוי משתנים איכותיים הסרת ההנחות משתנה מסביר מקרי תלות בין x ל- u עקיבות... 45... 50 מתאם בין ההפרעות האקראיות משתנה מסביר מקרי יחד עם מתאם סדרתי בהפרעות... 51 שונות שונה... 55.... 56... 59... בעית האנדוגניות של המשתנה המסביר אומד משתני עזר IV שיטת SLS... 60 שיטת הריבועים הפחותים העקיפה )ILS(... 60... משוואות מזוהות 4

E x + c = c + E x E x + y = E x + E y E c x = ce x חזרה על חוקי סטטיסטיקה חשובים משתנים תלויים: צפיה באחד מהם משפרת את היכולת לנבא את השני. E x\y = E x אמ"מ ב"ת ו- y x אם x ו- y ב"ת אזי cov(x,y)=0 )ההיפך אינו מתחייב( var x = E x E x = זו היתה נוסחה לחישוב השונות במדגם. לחישוב אומדן לשונות האוכלוסיה, מחלקים ב- n-1 במקום ב- n. var x + c = var x var c x = c var x var x + y = var x + var y + cov x, y var x y = var x + var y cov x, y cov x, y = E x E x y E y = y i y n cov c x, y = c cov x, y cov c ± x, y = cov x, y n מדד cov נותן לנו את עצמת המתאם בין המשתנים, אבל לא את כיוונה. cov x, y, z = var x + var y + var z + cov x, y + cov y, z + cov x, z E(x y) = E(x) E(y) אמ"מ ב"ת ו- y x t התפלגות נורמלית כאשר השונות לא ידועה. טרנספורמציה ליניארית של משתנה המתפלג נורמלית, מתפלגת אף היא נורמלית. 1 cov x, y σ x σ y 1 מקדם המתאם ρ: 5

y הבנת התנהגות של יחידות כלכליות המשתנה הנבדק / המוסבר, x המשתנה המסביר. אנחנו מניחים כי קיים קשר ליניארי בין המשתנים: בכלכלה קיימים שלושה סוגי מדגמים: y = α + βx i + ε i חתך אורך בדיקה של אותו משתנה לאורך זמן. האינדקס מסומן ע"י t. חתך רוחב בדיקה של משתנים שונים ביח' זמן אחת )או בלי מימד של זמן(. האינדקס מסומן ע"י i. מדגם פנל דגימה של קבוצה על פני זמן. אנחנו תמיד נניח כי לכל האנשים יש את אותו α ו- β. כדי למצוא את α ואת האמיתיים, ניעזר בשיטה שנקראת ריבועים פחותים,β.)OLS( כלומר, האומדים ל- α ו- β אומד הריבועים הפחותים בשיטה זו נרצה למצוא קו העובר בין התצפיות, הממזער את ריבועי המרחק )הטעות( בין כל תצפית אל הקו. את זה נעשה באמצעות פתרון בעית מינימום: min y i (α + βx i ) I α : y i α βx i = 0 II β : y i α βx i x i = 0.β שתי משוואות תנאי ראשון אלה נקראות גם המשוואות הנורמליות. תפקיד המשוואות האלה הוא "לסחוט" מ- Y את כל המידע האפשרי, ולהעמיס אותו על השיפוע כל מה שלא ניתן להסביר, מועמס על החותך שגיאת האומד )ההפרש בין y האמיתי ל- y שנאמד ע"י α ו- β ( כך:.α ניתן לסמן את u i = y i α βx i ואז ניתן להבין את משמעות המשוואות הנורמליות, כלומר, את התנאים שאנו כופים על האומד שלנו: u i = 0 u i x i = 0 משתי המשוואות הנורמליות אפשר גם להראות שאין מתאם בין u ל- x : u i u = 0 I cov x i, u i = 0 6

נמשיך לפתח את תנאי הקיצון: I y i α βx i = 0 y i = α + β x i Iy = Iα + Iβx y = α + β x כלומר, מתנאי סדר ראשון, נובע שהרגרסיה עוברת דרך נקודת הממוצעים.נמשיך לתנאי השני: II y i α βx i x i = 0 y i y + βx βx i x i = 0 y i y x i = β x i β = y i y x i = y i y x i x x i x i x β = cov x, y var x α = y βx אם כן, פתרון בעית ישר הריבועים הפחותים: β = y i y x i = y i y x i x x i x i x = cov x, y var x מכאן משתמע שהקשר בין X ל- Y תלוי בשונות המשותפת. הבעיה, שהשונות המשותפת לא מציינת את כיוון הקשר. כלומר, אנחנו לא יכולים לדעת אם X השפיע על Y או להיפך. קשר שימושי: y i y x i = y i y x i x = y i השאלות הנשאלות: האם β הינו אומד חסר הטיה ל- β? מה השונות של β?.1. 7

התוחלת של β נתחיל בבדיקה של השאלה הראשונה, כלומר, האם E β = β נחזור ל- β ונבטא אותו כך: )חוסר הטיה(. β = y i במקום y i ניתן להציב את הנחת העבודה המקורית שלנו, הכוללת את α ו- β האמיתיים: y i = α + βx i + u i β = α + βx i + u i נפרק את המכפלה שנוצרה לשלושה מחוברים, ונראה מה קורה. α = 0 )המכנה לא רלוונטי כיוון שבכל מקרה הביטוי מתאפס( βx i = β x i x = β )את β הוצאנו החוצה כי היא קבועה, וחיסרנו x בהסתמך על העיקרון שהוכחנו קודם( כתוצאה מהפיתוחים הנ"ל קיבלנו ביטוי חדש ל- β: β = β + u i למעשה, ההפרעות האקראיות u i מפריעות ל- β להיות שווה ל- β. לכן, במדגם יחיד, בטוח ש- β β. קורה כשעוברים ממדגם יחיד למדגמים מרובים, כלומר, מה התוחלת של נבדוק מה.β E β = E y i = E α + βx i + u i תוחלת של סכום שווה לסכום התוחלות, לכן בדיוק כמו קודם, נפרק את המכפלה למחובריה: E α = αe (x i x) = 0 E βx i = βe x i = β ולכן, התוחלת של β: 8

E β = β + E u i. כדי להמשיך, עלינו להניח שתי הנחות בשלב זה: תזכורת אנו רוצים להוכיח ש- β E β = x i לא מקרי, ולכן אפשר להוציא אותו מהתוחלת. זו הנחה סבירה X יכול להיות טמפרטורה או כל פרמטר אחר שקובע החוקר. תוצאת ההנחה הזו: E β = β + E u i = β + E(u i).e u i = 0 זאת כיוון ש- α תופסת את תוחלת ההזזה הנובעת מ- u. ההנחה הזו כוללת גם הנחה סמויה, והיא שלכל בני האדם יש את אותה התוחלת להפרעה אקראית. אם מוסיפים גם את ההנחה הזו, ניתן להסיק ש- β חסר הטיה..1..cov x, u = 0 זו לא הנחה מובנת מאליה, יתכן כי שתי ההנחות הללו לא מתקיימות. ניתן להניח, לחילופין, כי ויש לבחון את המשמעות הכלכלית של המשתנים השונים. נחזור לשלב שלפני ההנחות ונמשיך משם: E β = β + E u i = β + E u i u = β + E cov x, u var x = β ובכן, הוכחנו כי β חסר הטיה. המטרה כעת היא למצוא את השונות של אומד הריבועים הפחותים, ולהוכיח את משפט גאוס מרקוב, הטוען כי אומד הריבועים הפחותים הוא האומד הטוב ביותר תחת ההנחות. השונות של β אם כך, קיים לנו מודל הטוען y i = α + βx i + u i ואומד ל- β : β = Σ x i x y i = β + Σ x i x u i Σ x i x ברור כי β ישתנה ממדגם למדגם. המטרה שלנו היא למצוא את השונות של האומד, ולשאוף למינימום שונות, כמובן בהינתן ההוכחה על כך שהאומד גם חסר הטיה. נתחיל מחישוב נוסחת השונות: var β = E β E β β = E u i הנחנו ש- x משתנה לא מקרי ולכן אפשר להוציא אותו החוצה, כמובן בריבוע. = 1 E u i 9

נטפל כעת רק בחישוב התוחלת, ולצורך הפשטות נעשה זאת עם שתי תצפיות בלבד: E u i = E x 1 x u 1 + x x u = E x 1 x u 1 + E x x u + x 1 x x x E u 1 u הנחנו על התוחלת של ההפרעה האקראית שהיא שווה 0, ולכן מותר לנו לעשות את הצעד הבא: E u 1 u = E u 1 E u 1 u E u = cov(u 1, u ) הנחה שלישית: אין מתאם בהפרעה של שתי תצפיות שונות. כלומר,.cov u i, u j = 0, i j אחרי הצבה, אנחנו מקבלים שהסכום יצא מהסוגריים: var β = 1 E u i = 1 E u i E u i σ u.0 החלק האחרון בנוסחה, הוא למעשה השונות של u. i את ) i E(u יכולנו לחסר כי כזכור, הוא שווה הנחה רביעית: var(u).var u i = מתקבלת על הדעת, אבל לא מתחייבת. אם להניח שהפיזור של ההפרעות של כל הפרטים הוא זהה היא הנחה E u i E u i הוא השונות של u, היא זהה לכולם, וניתן להוציא אותה מהסכום. = σ u varβ = σ u I i=1 x i x ולכן, לנוסחה הזו יש שני חלקים, חלק טריוויאלי יותר וחלק טריוויאלי פחות. הגדלת המדגם, מקטינה את השונות. אבל זה די טריוויאלי. X אינו מקרי. שונות גדולה. זה הגיוני, כיוון שאם בוחרים Xים קרובים, יהיה מאוד קשה לוודא את הקשר בין X ל- Y בצורה אמינה. אם החוקר יבחר X עם שונות קטנה, השונות של β תגדל.לכן על החוקר לבחור Xים עם.1. במידה ואנו איננו יודעים את השונות של u אנו צריכים למצוא אומד ל- varβ, )וזהו המצב במציאות(, הנוסחה הזו בלתי פתירה. כדי לפתור בעיה זו, באמצעות מציאת אח"ה ל- σ u )לא נוכיח את חוסר ההטיה של הביטוי(: σ u = u i I i=1 I 10

כאשר כיוון שאיננו יודעים את u i = y i (α + βx) α ואת β האמיתיים, אנחנו משתמשים בנאמדים על תוצאות המדגם כדי לחשב אומדן ל- u. המכנה -I מוסבר ע"י כך שאיבדנו שתי דרגות חופש במהלך הדרך, כשגזרנו את בעית המינימום המקורית, והשווינו את הנגזרות החלקיות ל- 0. אחרי הצבת האומד, מקבלים: varβ = σ u I i=1 x i x הוכחת משפט גאוס מרקוב עד עתה הנחנו ארבע הנחות: x i לא מקרי. E u i = 0 cov u i, u j = 0 var u i = var u.1..3.4.y i = α + βx i + u i ישנה עוד תכונה של המודל שעדיין לא דיברנו עליה y מופיע בצורה לינארית במודל עבור ההוכחה שלנו, אנחנו דורשים מודל לינארי בפרמטרים. מבין כל האומדים הלינאריים )ב- Y ( שאינם מוטים, אומד הריבועים הפחותים הינו בעל השונות המינימלית, בכפוף לארבעת ההנחות התחיליות. המודל שנבחר חייב להיות לינארי בפרמטרים וגם לינארי ב- Y. נניח אומד כלשהו שהינו ליניארי ב- Y : כאשר k הוא ערך מחושב כלשהו שאינו מכיל את Y. נביט לרגע בנוסחת האומד המקורי: β = k i y i β = y i מתוכו, ניקח את החלק המודגש ונגזור ממנו משתנה חדש: ולכן כעת: w i = x i x 11

β = w i y i = β + w i u i נחזור לאומד שהנחנו קודם, ונפרק את k לשני חלקים w, שהוא חלק מהאומד המקורי, ו- s, שישלים ל- k של האומד החדש. β = s i + w i y i כעת נשאל מתי β הינו חסר הטיה. E β = E w i y i =β + E s i y i לכן כעת נותר לשאול מהם התנאים הנדרשים כך ש: = 0 i E. s i y נציב את Y: אבל.E w i y i = β E s i α + βx i + u i = s i α + β s i x i + s i E u i =0 מותר היה לנו לעשות זאת כיוון ש- S אינו מקרי. האיבר האחרון יהיה שווה 0 כיוון שתוחלתו של U שווה 0. כעת, כדי לאפס את שני החלקים הנותרים בביטוי, עלינו להגשים שני תנאים: s i = 0 s i x i = 0.1. כעת נכפה את התנאים הללו על β כתנאי מקדים, כלומר, נבחר רק את האומדים המקיימים את התנאים הללו. מה יצא לנו? β = s i y i + w i y i = β + w i u i + s i u i = β + w i + s i u i β = w i + s i u i + β כעת נחשב את שונות האומד, ונראה אם היא קטנה יותר מהשונות של אומד הריבועים הפחותים. var β = E β E β β = E w i + s i u i )המעבר אפשרי כיוון ש- β חסר הטיה(. בדומה למה שעשינו קודם, כדי לפשט, ניקח דוגמה של שני איברים. E w i + s i u i = E w 1 + s 1 u 1 + w + s u = E w 1 + s 1 u 1 + E w + s u + s 1 + w 1 s + w E u 1 u 1

כבר הנחנו קודם, E u 1 u = cov u 1, u = 0 נמשיך: = E w i + s i u i = w i + s i E u i = σ u w i + s i E u i E u i =σ u var β = σ u w i + s i var(β) = σ u I i=1 x i x נזכור את שונות אומד הריבועים הפחותים: את σ u אפשר לבטל, ולכן צריך להבין מה היחס בין הגודל של האיברים שנותרו. כלומר, יש להוכיח: 1 < w i + s i הוכחה: w i + s i = w i + s i + w i s i w i = x i x = = 1 זה שווה בדיוק לשונות של β. השונות. כעת נבדוק מה קורה עם האיברים האחרים האם הם מגדילים או מקטינים את s i > 0 הסכום של s i לא יכול להיות בדיוק שווה 0, כי אז האומד החדש היה שווה לאומד הריבועים הפחותים. בגלל הריבוע הוא גדול מ- 0. w i s i = s i s i = x i s i x s i = 0 אבל עקב התנאים שהגדרנו קודם לחוסר הטיה, הביטוי הזה שווה כולו ל- 0. σ u var β = + σ u s σ u i > = var(β) בסיכומו של דבר: 13

אומד הריבועים הפחותים = BLUE Best linear unbiased estimator = שימוש באומדים בחלק זה, נדבר על רווח סמך, מבחני השערות ותחזיות. β = β + u i מהנוסחה ברור שיש הפרש בין האומד לבין β האמיתית. הסטייה מ- β תלויה בעצם ב- u : זאת כיוון שב- x אני שולט. הנחה חמישית: ההנחה היא ש- u מתפלג נורמלית! u~n 0, σ u ה- u במדגם בלתי תלויים, ולכן יכול להיות מצב שכל ה- u במדגם יגיעו רק מצד אחד של ההתפלגות, ובערכים קיצוניים. אבל הסיכוי בהתפלגות נורמלית לאירועים קיצוניים הוא קטן מאוד. לפיכך אנחנו יכולים לתחום איזשהו תחום הערכה ל- β, ולספק עבורו הסתברות. רווח סמך ל- β תחת ההנחה ש- u מתפלג נורמלית, β מתפלג נורמלי גם הוא זאת כי טרנספורמציה ליניארית של משתנה המתפלג נורמלית, מתפלגת נורמלית אף היא. מכאן הגיעה דרישת הלינאריות באומד על מנת שיתפלג נורמלית. את השונות של t. בהתפלגות β איננו יודעים לכן בשיעור הקודם מצאנו לה אומד. זה אומר ש- β לא מתפלגת נורמלית, אלא כדי שנוכל לעבוד, אנו זקוקים לסטנדרטיות תוחלת 0 ושונות 1. ו- E(β-β )=0. β, היא β ראשית, נחסר את מהאומד את הפרמטר המקורי:.β-β מכן נחלק באומד סטית התקן של זאת כיוון שהתוחלת של לאחר :β t β β σ β t כאשר σ β = var β ולכן גם השונות תהיה 1, ונוכל לעבוד עם התפלגות t סטנדרטית. דרגות החופש להתפלגות t נקבעות לפי מספר התצפיות, פחות מספר המשוואות הנורמליות במודל. ככל שיש פחות תצפיות, t גדל, ולכן רווח הסמך גדל, והתשובה שלנו אינה אמינה. לכן מדגם קטן יגרור קיום רווח סמך גדול. 14

ע) רווח הסמך בנושא שלנו נכתב קצת אחרת ממה שעשינו בסטטיסטיקה ב'. נחזור לנוסחת האי שוויון ונעביר קצת אגפים: ולמעשה: β σ β t β β + σ β t P β σ β t β β + σ β t = 1 α כדי להקטין את רווח הסמך, יש להקטין את השונות של β להגדיל את "י הגדלת המדגם או בחירת xים מרוחקים(, או.α מבחני השערות מבחני השערות מוצגים בצורה הבאה: H 0 : β = 0 H 1 : β 0 תוצאה של מבחן השערות לעולם אינה בטוחה ב- 100% - וגם כאן יש לערב הסתברויות. טעות מסוג ראשון דחיתי את H 0 כאשר היא היתה נכונה. טעות מסוג שני קיבלתי את H 0 כאשר היא לא היתה נכונה. בקורס אנו מדברים רק על הטעות מהסוג הראשון. y i = α + βx i + u i במודל שלנו, השאלה הראשונה שנשאל תמיד היא אם השיפוע שווה ל- 0. כי אם השיפוע אפסי, אין קשר בין X ל- Y ואין טעם במודל. השערת האפס היא, ש- β=0. אם זה נכון, אז: tα β 0 σ β tα,0 רק אם ההשערה נכונה, המשתנה הזה מתפלג והמשתנה לא יכול להיות סטנדרטי נורמלי..t אם ההשערה אינה נכונה, התוחלת של הביטוי אינה שווה אם ה- t הסטטיסטי, המחושב מתוצאות המדגם, חורג מה- t הקריטי, אותו מצאנו בטבלה לפי ההסתברות לטעות אזי דוחים את ההשערה. t הסיכוי לדחות את ההשערה גדל. פרשנות למבחני השערות ב- EVIEWS : = Coefficient האומד 15

Prob = P. Value Mean dependent var = y SD dependent var = σ ŷ Sum squared resid = (u î ) SE of regression = σ û נניח בודקים השערה אחרת: tα H 0 : β = H 1 : β β σ β tα מותר עדיין לחלק בפיזור של β כיוון שתוספת של לא משנה את הפיזור של האומד. H 0 : β H 1 : β < t α β σ β H 0 : β H 1 : β > β σ β t α מותר לבצע גם מבחנים חד צדדים: במבחן שכזה, חוסמים רק מצד אחד. אותו דבר פועל גם בכיוון השני: דוגמה על פונקצית ייצור נניח שהמודל שלנו מסביר פונקצית יצור: y i = α + βx i + u i 16

H 0 : β = α H 1 : β α נגדיר משתנה חדש:.β -α תוחלתו: E β α = E β E α = β α לפי ההנחה שלנו, ההפרש הזה צריך להיות 0. המשתנה המנורמל יהיה: β α var β α var β α = varβ + varα cov(α, β) השונות של המשתנה הנבדק תהיה: את השונות של β אנחנו יודעים! חסרה לנו רק זו של α והשונות המשותפת. האומד של α.α את כל הדברים שבדקנו עבור β, כעת נבדוק עבור y = α + βx α = y βx α = 1 I y i βx נציב את האומד של β: α = 1 I y i x y i = 1 I x y i נשים לב שהאומד שלנו ל- α הוא לינארי ב- Y. כעת, נציב את y מהמדגם. α = 1 I x α + βx i + u i נפרק את האיברים אחד אחד: 1 I α = I 1 α = α I 17

x x i x α = x α (x =0 i x ) = 0 1 I βx i = 1 I β x i = 1 βix = βx I x x i x βx i =1 = x β x i = x β α = α + 1 I x x i x u i עם הכפולות של U i אין מה לעשות, ולכן נותרנו עם: למדנו כי שני האומדים שלנו, גם α וגם β, תלויים בהפרעות של המדגם. נסמן: s i = 1 I x x i x ולכן: α = α + s i u i נבדוק ש- α חסר הטיה: E α = E α + s i u i = E α + E s i u i = α + s i E u i =0 = α נמצא את השונות של α: =α var α = E α E α = E s i u i למען הפשטות נדגים שוב עם שתי תצפיות: E s 1 u 1 + s u = E s 1 u 1 + E s u + s 1 s E u 1 u הנחה E u 1 u = E u 1 E u 1 u E u = cov u 1, u = 0 var α = E u i s i = s i E u i E u i = σ u s i σ u =σ i u וכעת: 18

נמשיך לפתח את הסכום של ה- i s: s i = 1 I x x i x נפצל למחוברים לנוחות העבודה: 1 I = I I = 1 I x x i x = x = x 1 I x x i x = x I (x i x ) = 0 ולכן: var α = σ 1 u I + x וכרגיל, מי שקובע את שונות האומד, הוא הסטיה האקראית. וכמו קודם, את השונות של הסטיה איננו יודעים, ונוכל להשתמש באומד: x var α = σ 1 u I + השונות המשותפת של α ו- β =α cov α, β = E α E α =β β E β = E s i u i w i u i כרגיל, נדמה על שני איברים: E s 1 u 1 + s u w 1 u 1 + w u = s 1 w 1 E u 1 + s w E u + s 1 w E u 1 u + s w 1 E u 1 u cov u 1,u =0 כל ההצלבות נמחקות, ולכן נשארות לנו רק המכפלות עם אותו אינדקס. cov α, β = E s i w i u i = s i w i E u i E u i = σ u s i w i s i w i = 1 I x x i x x i x = x x i x = x 19

נציב חזרה בנוסחה: σ u x cov α, β = יש קשר ישיר במדגם בין השונות המשותפת לבין השונות של β : var(β) = σ u נחזור לבדיקת ההשערות שהתחלנו קודם : β α var α + var β cov α, β α = β α β var α β נבדוק, למשל, את ההשערה הבאה: אז המשתנה הנורמלי שלנו יהיה: var α β = var α + 4var β cov α, β מודלים שאינם לינאריים בפרמטרים מודל סמי לוגריתמי המודל הרגיל שלנו נראה כך: y i = α + βx i + u i יתכנו מודלים שאינם לינאריים במשתנים, כמו מודל סמי לוגריתמי: ln (y i ) = α + βx i + u i במודל שכזה, ln y i x i = β אבל החוקרים מעוניינים בקשר בין y i ל-,x i כך: 0

y i x i כדי להגיע לשם, נפצל את הביטוי לקשר דו שלבי. ln y i x i = y i x i ln y i y i y i x i = βy i = 1 y i כלומר, כל הזזה של x, מזיזה את y בשיעור β אחוזים. מודל לוגריתמי מלא ניתן לבדוק גם מודל שהוא לוגריתמי מלא: ln y i = α + β ln x i + u i מודל כזה יכול להיווצר ממודל שאינו ליניארי בפרמטרים: y i = α x i β e u i עליו מפעילים לוגריתם ומקבלים מודל לוגריתמי מלא: ln y i = ln α α + β ln x i + u i נפעיל את אותו כלי דו שלבי שהשתמשנו בו קודם: ln y i ln x i = y i x i ln y i y i 1 y i x i ln x i x i y i x i = β y i x i זוהי בדיוק הגדרת הגמישות! המשמעות הזזה של X באחוז אחד, מזיזה את Y בשיעור β אחוזים. חיזוי השאיפה שלנו היא לחזות במונחי זמן, ולא במונחי יותר מעניין לבצע תחזיות על אותה אוכלוסיה לאורך זמן, מאשר לפרטים שנמצאים מחוץ לאוכלוסיה. לכן המודל שלנו יראה כך: i,t y t = α + βx t + u t התחזית שאנו רוצים לבצע היא: y T+K \x T+K ברוב המקרים נקבע את 1=K. יש לזכור כי את X "של מחר" אנחנו קובעים, כי אינו משתנה מקרי. לכן התחזית שלנו: 1

y T+1 = α + βx T+1 בשלב זה אנו משמיטים את ה- U כיוון שהתוחלת שלו היא 0. E y T+1 = E α + βx T+1 = α + βx T+1 = E(y T+1 ) כעת אנו מעוניינים לבנות רווח סמך ל- Y האמיתי, על סמך Y החזוי. הסיפור פה יהיה יותר מסובך, זאת כיוון ש- β האמיתי היה קבוע, ולא היתה לו שונות לעומת זאת, ל- Y האמיתי בהחלט יש שונות. tα y T+1 y T+1 var y T+1 y T+1 P.E tα var y T+1 y T+1 = var α + βx T+1 + u T+1 α + βx T+1 α,β,x אינם מקריים, לכן אינם משפיעים על השונות. = var u T+1 α βx T+1 = σ u + var α + x T+1 var β cov u T+1, α x T+1 cov u T+1, β =0 x T+1 cov α, β =x var β את השונות המשותפת של α עם ההפרעה האקראית של מחר אפשר לאפס: זאת כיוון שהאומד תלוי בהפרעה האקראית של המדגם, והנחנו כי אין תלות בין ההפרעה האקראית של תצפיות שונות. כנ"ל לגבי β. = σ u + var α + x T+1 var β x T+1 x var β =0 מציבים במקום α ו- β את השונויות שלהם ומוציאים גורם משותף: var y T+1 y T+1 \x T+1 = σ PE = σ u 1 + 1 T + x T+1 x x t x הגורמים המשפיעים על התחזית: ככל ששונות ההפרעה גדלה, אי הדיוק גדל. ככל שנבחר X למחר שקרוב יותר ל- X הממוצע, הדיוק גדל. ככל שכמות התצפיות T גדלה, גם הדיוק גדל..1..3 y T+1 tασ PE y T+1 \x T+1 σ PE tα + y T+1 נציב חזרה ברווח הסמך ונקבל:

השונות של התחזית לא משתנה, כלומר, רווח הסמך לא גדל, במידה ונרצה לבצע תחזית של +T או רחוק מכך )בהנחה ש- α ו- β האמיתיים לא משתנים על פני זמן(. זה כיוון שאנו מניחים ש- X לא מקרי: אם X כן היה מקרי, זה היה מכניס עוד מקום לטעות. השפעת שינוי סקאלה על האומד יש לנו מודל כזה: y i = α + βx i + u i ומישהו אומד מודל אחר: y i = γ + δz i + ϵ i וניתן הקשר: z i = 10x i מקבלים כי: δ = z i z y i z i z = 10x i 10x y i 10x i 10x = 1 10 y i = β 10 כלומר, אם z חזק פי 10 מ- x, אז β צריך להיות חזק יותר פי 10 מ- δ. γ = y δz = y 1 המשמעות : הכפלה בקבוע אינה מזיזה את החותך. β 10x = α 10 z i = x i + 5 נבדוק מה קורה אם השינוי יהיה הזזה לינארית: δ = z i z y i z i z = y i = β אין השפעה על β. γ = y δx = y β x + 5 = y βx β5 = α 5β מדד לאיכות הרגרסיה R המדד הזה הוא מדד מסוכן, ומותר להשתמש בו רק במקרים מסויימים. ראשית נוכיח את המדד, ולאחר מכן נלמד את הלוגיקה באשר מתי מותר להשתמש בו. y i = α + βx i + u i 3

דחינו את השערת האפס, ואנחנו בטוחים שיש קשר H 0 : β = 0 H 1 : β = 1 ל- Y. X בין β אבל זה עדיין לא נותן לנו מידע לגבי חשיבות הקשר! כלומר, יתכן שיש דברים שמשפיעים על התזוזה של Y בצורה משמעותית הרבה יותר מ- X. ככל ש- X אחראי יותר על התזוזות של Y, הרגרסיה שלנו באיכות טובה יותר. אנחנו רוצים להסביר את התזוזות של Y מתצפית לתצפית, ולראות מתי התזוזה היתה בגלל X ומתי לא. כשאנחנו בוחנים את Y, הממוצע שלו לא מעניין הרגרסיה תמיד עוברת בנקודת הממוצעים בכל מקרה. לכן ננטרל את הממוצעים. כדי שהפרשים שליליים לא ינטרלו חיוביים, נעלה את ההפרש בריבוע. שיטת הבדיקה הזו מתאימה רק למודלים עם חותך, כי אחרת הרגרסיה לא עוברת בנקודת הממוצעים. y i = α + βx i + u i y = α + βx I i=1 y i y = β x i x + u i = β + u i + β u i =0 הסיבה שאין מתאם בין U ל- X היא ש- X "סוחט" את כל ההשפעה האפשרית על Y מ- U. זו למעשה המשמעות של המשוואות הנורמליות. מה שנשאר ב- U אלה דברים שאין שום אפשרות להסביר אותם על ידי נחלק את שני הצדדים של המשוואה בפיזור של Y:.X SSR 1 = β + SST y i y R R = SSR SST SSE u i SST y i y 1 R יותר גדול, אז,1- R כלומר, החלק של R ככל ש- Y. מבטא כמה המשתנים המסבירים תורמים לפיזור של R ההפרעות יותר קטן. הקשר בין R למקדם המתאם R = β x i x cov x, y = y i y var x var x var y = cov x, y σ x σ y R = ρ שוויון זה תקף רק אם יש משתנה מסביר אחד בלבד. 4

שינויים ב- R אם יש רק שתי תצפיות, 1= R. אם נוסיף למדגם תצפית בה X ו- Y שווים לערכים הממוצעים, למעשה הוספנו עוד תצפית שנמצאת על נקודת הממוצעים, שלא יוצרת חריגה. גם המונה וגם המכנה לא השתנו, ולכן R לא השתנה. R עולה. אם הוספנו תצפית היושבת על הרגרסיה, המכנה גדל, בצד שמאל המונה גדל, בצד ימין הוא קטן - אם הוספנו תצפית שלא יושבת על קו הרגרסיה, α ו- β השתנו, ולא ניתן לדעת בדיוק מה יקרה ל-. R שיטת הריבועים הפחותים מבטיחה R מקסימלי. זה בגלל שבסיס השיטה הוא מזעור הטעויות בריבוע. השוואת שתי רגרסיות מתי אסור להשוות שתי רגרסיות באמצעות מקרה 1?R האם ניתן להשוות את ציוני R שנקבל משני המודלים הללו? min y i α βx i u i min y i γ δx i θz i ε i למעשה, תמיד הולך להתקיים המצב הבא : ε i u i למה? זאת כיוון שאם θ היה שווה 0, כלומר, המחשב לא היה מוצא קשר בין Z ל- Y, סכום הטעויות היה זהה. בכל מקרה אחר סכום הטעויות היה קטן יותר, כיוון שאין סיבה שהמחשב יחפש להגדיל את הטעויות. המשמעות היא ש - R גדל כשמספר המשתנים גדל ולכן אי אפשר להשתמש בו להשוואה בין מודלים בהם מספר המשתנים שונה. קיים גם R מתוקנן: R = I + K I K 1 R כאשר K הוא מספר המשתנים המסבירים. כלומר, כשמוסיפים עוד משתנים מסבירים, R המתוקנן יקבל "מכה" כלפי מטה, וכדי שלא ירד, השונות תצטרך לרדת באופן חד יותר. עם זאת, R המתוקנן יעלה לא רק אם המשתנה המסביר החדש מספיק מובהק וחשוב. כדי שהמתוקנן יעלה מספיק שיתקיים: 5

שהוא, כידוע, רחוק מאוד מהמובהקות הנדרשת על ידינו ( 1.96 עבור מובהקות 95%(. בשורה התחתונה: גם עם תיקנון של יתכן שהמדד יעלה עם הוספת משתנה מסביר נוסף, גם אם רמת המובהקות שלו נמוכה. לכן צריך להיזהר בשימוש גם במדד הזה בהשוואה בין מודלים בעלי כמות שונה של משתנים.,R מקרה y i = α + βx i + u i ln y i = γ + δx i + ε i זאת כיוון שמשתנה באופן מהותי הפיזור של Y. מקרה 3 כשבודקים את שיעור השינוי של Y לאורך זמן: y t = α + βx t + u t y t y t 1 y t 1 = γ + δ x t x t 1 x t + ε t הבעיה במודל השני, הוא שרמת השינוי היא מאוד עדינה. הגודל במונחים אבסולוטיים הוא פחות או יותר יציב, אבל ההפרש בין שינוי באחוז לבין שינוי בשני אחוז, הוא מאוד דרמטי. לכן מדידת שיעורי שינוי מבטיחה R גרוע ביותר. y i = α + βx i + γz i + u i min y i α βx i γz i α,β,γ I α : y i α βx i γz i = 0 (II) β : y i α βx i γz i x i = 0 רגרסיה מרובת משתנים III γ : y i α βx i γz i z i = 0 6

I Iy = Iα + βix + γiz y = α + βx + γz כלומר, גם ברגרסיה מסוג זה, היא תעבור דרך נקודת הממוצעים. ו- III. II II y i y βx γz βx i γz i x i = 0 נציב את α מהמשוואה הנ"ל במשוואות y i y x i = β x i + γ z i z x i III y i y βx γz βx i γz i z i = 0 y i y z i = β z i + γ z i z z i כדי שיהיה לנו קל לעבוד, נלמד כתב קיצור: y i y x i x = M yx x i = M xx נציב: II M yx = βm xx + γm xz β = M yx γm zx M xx III M yz = βm xz + γm zz γ = M yz βm xz M zz β = M yx M yz βm xz M zz M xx M zx = M yx M zz M yz βm xz M zx M xx M zz β M zz M xx βm xz = M yx M zz M yz M xz β = M yxm zz M yz M xz M zz M xx M xz לצורך השוואה, במודל עם שני משתנים, האומד שלנו הוא: β = M yx M xx אם M xz היה שווה 0, היינו מקבלים את אותו האומד. מתברר, שאם אין מתאם בין X ל- Z, ניתן להשתמש גם במודל הפשוט כדי לאמוד את הקשר בין X ל- Y, גם אם המודל הכולל את Z הוא הנכון. 7

אם X ו- Z מתואמים, חייבים למדוד את כל המודל יחד: אחרת Z! יספוג את כל ההשפעה של X אם אין מתאם בין X ל- Z, הייתי מקבל את אותם אומדים גם במודל של משתנה אחד וגם במודל של שניים, γ = M yzm xx M yx M xz M xx M zz M xz והשפעת המשתנה המושמט תיספג ב- u. β = M yx M zz M yz M xz = M zz z i z M xz y i y M zz M xx M xz M xx M zz M xz = M zz z i z M xz α + βx i + γz i + u i M xx M zz M xz α חוסר הטיה נפרק את המכפלה למחובריה. כופל ראשון: M zz α z i z M xz α = M zz α =0 M xz α z i z =0 = 0 כופל שני: β M zz βx i z i z M xz βx i = M zz M xx M xz βm zz x i βm xz z i z x i =M xx =M xz = β M zz M xx M xz כופל שלישי: M zz γz i z i z M zx γz i = γm zz z i M xz γ z i z z i = 0 כרגיל נישאר רק עם הכופל האחרון, u. γ β = β + M zz z i z M xz u i M xx M zz M xz E β = E β =β + M zz z i z M xz E u M xx M zz M i = β xz הנחה 0= ולכן האומד חסר הטיה. שונות var β = E β E β =β = E M zz z i z M xz u i M xx M zz M xz למען הנוחות, נסמן: 8

L i = x i x M zz z i z M xz M xx M zz M xz var β = E L i u i שוב, למען הפשטות, נעבוד עם שני איברים ראשונים: E L 1 u 1 + L U = L 1 E u 1 + L E u + L 1 L E u 1 u =0 var β = E L i u i = E L i u i = L i E u i לכן, שוב, הסכום יכול לצאת מהריבוע. נחזור מ- L לביטוי המקורי ונטפל רק במונה: M zz z i z M xz E u i = σ u M zz z i z M xz M zz z i z M xz M xx = = M xx M zz M zz M xz M zz + z i z ניפרד לרגע משונות הטעות ונמשיך לעבוד עם הסכום שנותר: M zz var β = σ u M xx M zz M zz M xz M xx M zz M = σ u xz σ u = M xx 1 M xz M xx M zz var β = σ u M xx 1 ρ x,z var β = σ u M xx M xz M xz M zz M xz z i z M zz M xx M zz M xz נציב הכל בחזרה במקום ונקבל: = σ u M xx M xz M zz במודל הקודם, השונות היתה: שתי מסקנות: א. אם אין מתאם בין x ל- z )כלומר, 0= x,z ρ(, המודל יוצא אותו מודל, והשונות היא אותה שונות. 9

ב. ככל שיש מתאם גדול יותר בין x ל- z, השונות גדלה. זה בגלל שקשה יותר להבחין מי תרם יותר ל- y. מתאם גבוה יותר בין x ל- z, מחליש את יכולת האבחנה של המודל, ותגרור רווחי סמך גדולים יותר. אם הם זזים לגמרי ביחד, כלומר מתאם מלא )1= x,z ρ(, השונות תהיה אינסופית. יש לשים לב: את שונות הטעות האמיתית, אנחנו לא יודעים. אומד השונות לטעות הוא: u i σ u = מס פרמטרים I במדגם הגדול יש פחות טעויות, ולכן הסכום במונה יהיה קטן יותר. מצד שני, יש יותר פרמטרים, ולכן גם המכנה קטן. המשמעות היא שאנחנו לא יודעים מה יקרה לאומד השונות כשעוברים למודל בעל יותר פרמטרים. אם עובדים עם מודל שיש בו יותר משני משתנים מסבירים, לא ניתן לחשב מקדם מתאם. במקרה כזה, השונות תהיה: σ u M xx 1 R כאשר את ה- R יש לחשב עבור רגרסיה שתקשר בין המשתנים המסבירים: x i = δ 0 + δ 1 z i + δ k i + ε i הסדר של הקשר בין המשתנים המסבירים אינו משנה: z i = γ 0 + γ 1 x i + γ k i + ε i מולטי קוליניאריות מושלמת אם יש מולטי קוליניאריות מושלמת בין המשתנים המסבירים, מקבלים שונות אינסופית, ולמעשה לא ניתן אפילו לקבל אומדים. y i = α + βx i + γz i + u i I y i α βx i γz i = 0 II y i α βx i γz i x i = 0 III y i α βx i γz i z i = 0 נניח שיש קשר ליניארי מושלם בין x ל- z : x i = A + cz i II y i α βx i γz i A + cz i = 0 A y i α βx i γz i + c y i α βx i γz i z i = 0 30

אבל החלק הראשון התאפס בגלל I, והחלק השני התאפס בגלל :III ומשוואה II כולה מתאפסת. אז נותר לנו לפתור שתי משוואות עם שלושה פרמטרים, מצב בו יש אינסוף פתרונות ולכן לא ניתן לאמוד את הפרמטרים. אין שום יכולת להפריד בין ההשפעה של למשל, מודל של שכר: z. להשפעה של x ln w i = α + שכלהה β i + ילג γ i + ותקו δ i + ε i i שכלהה+ i ילג= i ותקו 6 3 מודל כזה כופה קוליניאריות מושלמת על המודל. במקרה כזה, חלק מהתוכנות לא יחזירו פתרון כלל, ותוכנות אחרות מניחות שאחד הפרמטרים הוא 0, ואומדות את האחרים. אפשר להסתכל על המולטיקוליניאריות בדרך נוספת: x i = A + cz i y i = α + βx i + γz i + u i y i = α + β A + cz i + γz i + u i y i = α + βa + βc + γ חותך שיפוע z i + u i כלומר, המקדם של z כולל רכיב של,x ולא ניתן לדעת כמה כל אחד מהם תרם באמת לשינוי ב- y. המולטי קוליניאריות לא חייבת להיות מושלמת כדי שתעמוד בפנינו בעיה: מספיק שהיא תהיה מספיק גבוהה, כדי שנקבל שונות אסטרונומית, איתה לא נוכל לעבוד. לא נוכל לדחות אף השערה! השערה β t t σ β אף רווח סמך לא יוכל לדחות את השערת האפס שהפרמטר להתחייב על קשר בין אף אחד מהפרמטרים לתזוזה ב- y. אבל y זז! 0=β או 0=γ בוודאות מספיקה. אף חוקר לא יוכל כדי שנוכל בכל זאת לבדוק את ההשפעה של הפרמטרים על המשתנה התלוי, ננטש את מבחן שיודע לבדוק יותר מהשערה אחת בו זמנית. t ונעבור למבחן,f H 0 : β = γ = 0 H 1 : β 0 γ 0 מבחן כזה יוכל לומר לנו אם יש קשר בין β ו- γ ל- y אבל לא יוכל לומר לנו מי הוא זה שהשפיע. כלומר, לא נוכל לדעת את ההשפעה בנפרד, אבל לפחות נוכל להסיק מסקנה לגבי ההשפעה המשותפת. מבחן F במבחן F מריצים מספר רגרסיות. 31

זהו המודל הלא מוגבל, y i = α + βx i + γz i + u i,unrestricted ואותו מריצים ראשון. לאחר מכן מריצים מודל מוגבל )במקרה שלנו, מוגבל ע"י כך ש- :)β=γ=0 המבחן עובד כך: התוצאה תהיה, בכמה הטעויות גדלו עבור כל מגבלה. y i = α + ε i SSE R SSE UN מספר המגבלות כעת ננרמל את התוצאה, כדי שנקבל את השינוי באחוזים; ומחלקים במספר התצפיות פחות מספר הפרמטרים, על מנת לישר את הסקאלה )את סדר הגודל(. SSE R SSE UN מספר המגבלות SSE UN מספר פרמטרים במודל הלא מוגבל I = SSER SSE UN מונה, מכנה σ F~ מספר המגבלות α u α רמת הוודאות. מונה מספר המגבלות. מכנה מספר התצפיות פחות הפרמטרים במודל הלא מוגבל. התוצאה של F תמיד תהיה חיובית )מבחן ריבועי(. אפשר לבדוק, למשל, את ההשערה: במקרה כזה מריצים את המודל הלא מוגבל, ואת המודל המוגבל: H 0 : β = γ = 5 H 1 : β 5 γ 5 y i = α + 5x i + 5y i + ε i אך המחשב לא יודע איך להריץ רגרסיה כזו, ולכן מיצרים משתנה חדש ועליו מריצים רגרסיה: מבחן F עם מגבלה אחת k i = α + ε i k i = y i 5x i 5z i 3

אנו רוצים להוכיח כי כאשר בודקים רק מגבלה אחת עם F, מקבלים את אותה תוצאה כמו במבחן t. SSE R SSE UN מספר המגבלות SSE UN מספר פרמטרים במודל הלא מוגבל I F =? t = F =? t = β σ = β β u i I y i = α + βx i + u i H 0 : β = 0 H 1 : β 0 הרגרסיה המוגבלת: y i = α + ε i min α y i α y i α = 0 α = y SSE R = y i y i = y i y = β + u i α = α + βx i + u i α + βx + β u i SSE UN =0 נציב חזרה במשתנה F: β F = β 1 SSE UN מספר פרמטרים I = β u i I = t והגענו חזרה להתחלה, כלומר, הוכחנו את הנדרש. עם זאת, הוכחנו את הנדרש עבור מבחן בו יש רק α ו- β! זה בגלל שבמודל המכיל פרמטרים נוספים, השונות של משתנה, וההוכחה שהצגנו כבר לא רלוונטית. לעשות הוכחה מפורטת על מודלים בעלי פרמטרים מרובים תהיה מורכבת, וננסה לחשוב על זה בצורה לוגית. למשל, זהו המודל המלא שלנו: y i = α + βx i + γz i + u i נבנה משתנה חדש: 33

k i = y i γz i ועכשיו שוב יש לנו מודל בו יש רק :β k i = α + βx i + u i ולכן כל המסקנות הקודמות שלנו תקפות גם למודלים מרובי משתנים! בדיקת כל הפרמטרים בו זמנית ישנו מקרה פרטי בו כל הפרמטרים שווים ל- 0 מלבד החותך. במקרה כזה לא חייבים להריץ שתי רגרסיות - נפתח קיצור: y i = α + ε i α = y SSE R = y i y = SST SST SSE UN = SSR UN SSE R SSE UN מגבלות SSE UN פרמטרים I = SSR UN מגבלות SSE UN פרמטרים I 1 SST 1 SST = R מגבלות 1 R ~F פרמטרים I רגרסיה עם משתנה ריבועי ברגרסיה שיש בה משתנה מסביר אחד, הקו יכול להיות לינארי עולה ויורד בלבד. אבל זה לא תמיד מתאר את המציאות למשל, בשכר כפונקציה של גיל, ישנה עליה, ובנקודה מסוימת ירידה. במקרה כזה כדאי להשתמש ברגרסיה עם מודל כזה )X גיל, Y שכר(: ואז נוצר שיפוע שתלוי בגיל : y i = α + βx i + γx i + u i y i x i : β + γx i במקרה של מדגם שבו אין ירידה בשכר, אך נתנו מודל ריבועי, המחשב עדיין ייתן קו שיורד אחרי התצפית האחרונה. יש להיזהר עם הסקת מסקנות מרגרסיות כאלה, ולבצע תחזיות רק על גילאים באיזור שבו היו תצפיות. 34

טעויות ספציפיקציה טעויות ספציפיקציה טעויות ניסוח, מודל שאינו נכון. אנו נתעסק בשני מקרים: שכחנו להכניס משתנה חשוב- השמטת משתנה רלוונטי. הכנסנו משתנה שאינו חשוב הכנסת משתנה לא רלוונטי..1. השמטת משתנה רלוונטי נניח שהמודל הנכון הוא: y i = α + βx i + γz i + u i אבל בטעות אמדו את המודל הבא: y i = δ 0 + δ 1 x i + ε i השאלה הנשאלת היא, האם δ 1 עדיין נכונה, גם לאור המודל המקורי? כלומר, נשאל האם: E δ 1 = β δ 1 = y i = α + βx i + γz i + u i = β + γ z i + u i γ z i = γcov x i, z i var x i ולכן: E δ 1 = β + γcov x i, z i var x i 35

לכן, כפי שהסקנו בעבר, אם אין קשר בין x ל- z, אין הטיה והפרמטר נשאר זהה. אם יש קשר, הפרמטר זז, וספג לתוכו גם השפעה של הפרמטר שהושמט. הכנסת משתנה לא רלוונטי המודל הנכון הוא: y i = δ 0 + δ 1 x i + ε i והמודל הנאמד הוא: y i = α + βx i + γz i + u i β = M zz z i z M xz y i M xx M zz M xz = M zz z i z M xz δ 0 + δ 1 x i + ε i M xx M zz M xz = δ 1 + M zz z i z M xz ε i M xx M zz M xz לכן, כשמוסיפים משתנים אקסטרה, המשתנים שגם ככה היו אמורים להיות במודל במקרה זה מגיע בשונות. במקום לקבל שונות "רגילה" של: הם חסרי הטיה. המחיר σ u var δ 1 = מקבלים שונות גדולה יותר של: var β = σ u M xx 1 ρ x,z המסקנה היא שתוספת משתנים מיותרים גורמת למבחני השערות לא יעילים. הקשר בין שני המודלים y i = δ 0 + δ 1 x i + ε i y i = α + βx i + γz i + u i האם יש קשר מספרי מחייב בין המשתנים בשני המודלים? נציב את האומדים זה בזה: δ 1 = y i = α + βx i + γz i + u i cov x,u =0 = β + γ z i + u i 36

צורות שונות של משוואת הרגרסיה δ 1 = β + γ z i y i = αx i β k i γ + e u i ln y i = ln α + β ln x i + γ ln k i + u i אם =β, אז כל תזוזה של אחוז ב- X, Y תזיז את Y בשני אחוזים. ln y i = α + βx i + γz i + u i במקרה זה, β מתאר את אחוז השינוי ב- Y עבור כל יחידת שינוי ב- X. בכל אחד מהמודלים האלה, ההשפעה של X על Y אינה ליניארית. נניח שאנחנו רוצים לבדוק את השפעת ההשכלה והגיל על השכר. אך אנו מאמינים שהשפעת ההשכלה תלויה בגיל )נניח, מגיל 30 עד 65 יש השפעה גדולה של השכר על גובה ההכנסה(. יתכן שההשפעה של משתנה מסוים תהיה תלויה במשתנים אחרים! y i = α + βx i + γz i + δx i z i + u i y i x i = β + δz i לפי הגזירה ברור שההשפעה של X תלויה ב- Z. אם נדבר במונחי הדוגמה, ההשפעה של ההשכלה, תלויה באיזה גיל אתה. באופן דומה: y i z i = γ + δx i גם במודל ה- lnי מתקיים הקשר הזה: הפרמטר β מבטא אחוזי שינוי ב- y, אבל ה- y בעצמו נקבע על ידי כל המשתנים המסבירים. משתנים איכותיים נניח y מתאר הוצאה כספית חודשית של משפחה. y i = α + u i לפי המודל הזה, אוכל רק לתאר את ממוצע ההוצאה. כעת נניח כי קיימים שלושה סוגי משפחה רווקים, נשואים וגרושים. אנו מאמינים כי דפוסי ההוצאות של כל אחד מסוגי המשפחה שונה. 37

הפתרון לפיו מייצרים x המקבל 1 עבור רווקים, לנושאים ל- 3 לגרושים לא נכון. אנו כופים כך סדר פנימי )הנשואים תמיד יהיו בין הרווקים לגרושים( ועוצמת שינוי )בחירת מספר גדול יותר לאינדקס תגרור שינוי משמעותי במספרים(. לכן, עבור כל מצב משפחתי אנו מייצרים משתנה מסביר, אותו נסמן בד"כ ב-.)dummy( d D 1i, D i, D 3i המשתנה D 1i יקבל 1 עבור רווקים, ו- 0 אחרת. כנ"ל לשני המשתנים האחרים, עבור נשואים וגרושים. בשיטה הזו, זה לא משנה אם נרשום 8 במקום 1: זהו פשוט שינוי סקאלה, ונצטרך לחלק את האומד ב- 8. y i = α 1 + α D 1i + α 3 D i + α 4 D 3i + u i min y i α 1 α D 1i α 3 D i α 4 D 3i I α 1 : u i = 0 II α : u i D 1i = 0 III α 3 : u i D i = 0 IV α 4 : u i D 3i = 0 את המודל הזה, כפי שהוא כתוב כרגע, לא ניתן לאמוד! II + III + IV = u i D 1i + D i + D 3i 1 קבוע = 0 const u i = 0 = (I) קיבלנו מולטיקולינאריות מושלמת. מדוע זהו המצב? = α 1 + α רווק = α 1 + α 3 נשוי = α 1 + α 4 גרוש אם α 1 מופיע בכולם, כיצד נוכל להפריד ולומר מה ההשפעה של החלק הייחודי לכל קבוצה? אם כולם שונים מהנורמה, אז מהי הנורמה? לכן, נוכל לאמוד שלושה פרמטרים בלבד, ולא ארבעה. ישנן שלוש שיטות לעשות זאת. שיטה 1 y i = α 1 D i1 + α D i + α 3 D 3i + u i 38

min u i I y i α 1 D 1i α D i α 3 D 3i D 1i = 0 II y i α 1 D 1i α D i α 3 D 3i D i = 0 III y i α 1 D 1i α D i α 3 D 3i D 3i = 0 כל משוואה נורמלית מייצגת מצב משפחתי אחד- כי המצבים המשפחתיים האחרים מתאפסים. כך, אם הנבדק בתצפית שלנו הוא רווק, נקבל: רווקים y i α 1 = 0 α 1 = y וכך, כל פרמטר מייצג את ממוצע ההכנסה של כל אוכלוסיה. שיטה נשמיט את אחת מהקבוצות מהרגרסיה: y i = β 1 + β D 1i + β 3 D i + u i בשיטה הזו, הקבוצה ה"נורמטיבית" היא הגרושים אליה מתייחסות הקבוצות הנותרות. נשואים, β 1 + β 3 = y רווקים, β 1 + β = y גרושים β 1 = y התוצאה המתקבלת בשתי השיטות היא זהה לחלוטין! ההבדל הוא, בנוחיות העבודה בבדיקת השערות. בשיטה הראשונה, זו תהיה השערת המחקר שלנו: H 0 : α 1 = α = α 3 הבעיה במקרה זה היא שלא נוכל להשתמש בבדיקה המקוצרת שלמדנו על מבחני F, הפרמטרים וזה כי אין לנו חותך. במקרה בו מאפסים את כל עם זאת, בשיטה השניה: H 0 : β = β 3 = 0 במקרה זה, למרבה האושר, כן נוכל להשתמש בבדיקת F המקוצרת באמצעות R! הידד! במידה ובחינה זו נכשלה, נרצה לבדוק אם נוכל "לחסל" פרמטרים מהמודל המקורי: כלומר, יתכן ואין בכלל הבדל בהכנסה בין רווקים לנשואים, כך נוכל להיפטר מאחד הפרמטרים ולהקטין את שונות האומדים. כדי לעשות זאת נשתמש במבחן t רגיל, על כל אחד מהפרמטרים. בשיטה השניה, עושים זאת בקלות: t β 0 σ β t אבל, בשיטה הראשונה והמבאסת, זה יהיה הסטטיסטי שלנו: 39

α 1 α var α 1 α שהוא, כמובן, הרבה יותר קשה לחישוב. בשיטה השניה, לקבוצה המושמטת נקרא "קבוצת ההתייחסות".)Reference Group( שיטה 3 בשיטה זו, ניתן פשוט להריץ רגרסיות נפרדות על כל חלק של המדגם המייצג קבוצה נבדקת. התוצאה תצא זהה לחלוטין לזו של השיטות הקודמות, אבל נקבל שונות אחרת. בשיטות 1 ו-, זו תהיה שונות הטעות: אבל בשיטה הזו, נקבל שונות גדולה יותר: σ u = u i I 3 σ u = u i 1 רווקים אם השונויות של הקבוצות במדגם שווה, אפשר לחשב שונות אחת לכולם יחד, וכך להימנע מההפחתה ברמת הדיוק. עם זאת, אם השונות אינה שווה בין הקבוצות, חייבים לפצל את חישוב השונות. מה היה קורה לו היינו משמיטים שני משתנים איכותיים? y i = β 1 + β D i + u i במקרה כזה, β 1 יהווה הממוצע של שני המשתנים שהושמטו, ו- β יהיה ההבדל מהממוצע. באופן עקרוני, במקרים רבים נצטרך להשמיט משתנים כאלה כדי למנוע מהרגרסיה להתנפח לגדלים עצומים. מודל הכולל משתנים איכותיים עם משתנים כמותיים נניח היה לנו המודל ההתחלתי, y i = α 0 + α 1 x 1 + ε i כעת נניח שאנו סבורים שהשפעת משתנה איכותי, למשל, מצב משפחתי, משנה את השפעת המשתנים הכמותיים, למשל גיל. המודל בשיטה 1: y i = β 1 D 1i + β D i + β 3 D 3i + β 4 D 1i x i + β 5 D i x i + β 6 D 3i x i + u i כל מה שמסומן ב- D 1i בא לידי ביטוי רק במקרה של רווקים: ולכן החותכים והשיפועים שיחושבו באמצעות β 1 β 4 ו- יהיו רלוונטים רק למקרה זה. המודל בשיטה : y i = γ 1 + γ D i + γ 3 D 3i + γ 4 x i + γ 5 D i x i + γ 6 D 3i x i + u i 40

בשיטה השניה, γ ו- γ 5 מבטאים את ההפרש בין נשוי לרווק )כלומר, ההפרד ביניהם לבין γ 1 ו- γ 4 בהתאמה(. אין חובה שהקבוצה המושמטת תהיה זהה בחותך ובשיפוע. התוצאות בין המודלים של שתי השיטות יהיו כמובן זהות: β = γ 1 + γ, β 5 = γ 4 + γ 5 H 0 : γ = γ 3 = γ 5 = γ 6 = 0 וכן הלאה. אחרי שנאמוד את המודל, נרצה לבדוק: בדיקה זו מוודאת שאכן יש הבדל בין הקבוצות. המודל המוגבל שלנו יראה כך: y R i = α 0 + α 1 x i + ε i ריבוי משתנים איכותיים יכול להיות מצב שבו ארצה להפריד את הרגרסיה שלי, למצב שבו יש הבדל בין גבר ואישה, וגם הבדל בין מי שגר בעיר למי שגר בכפר. במקרה כזה, יהיו שתי קטגוריות של משתני :Dummy אחת למין, והשניה למגורים. נגדיר: אחרת 0,גבר = 1 i D ;אחרת 0,אישה = 1 1i D אחרת 0,כפר = 1 i F ;אחרת 0,עיר = 1 1i F y i = β 1 D 1i F 1i אישה בעיר + β D 1i 1 F 1i אישה בכפר + β 3 1 D 1i F 1i גבר בעיר + β 4 1 D 1i 1 F 1i גבר בכפר + ε i ניתן לכתוב את המודל גם בשיטת קבוצת ההתייחסות: y i = γ 1 + γ D 1i + γ 3 F 1i + γ 4 D 1i F 1i + ε 1 גבר בכפר 1 γ γ 1 +γ 3 γ 1 +γ γ 1 +γ +γ 3 +γ 4 גבר בעיר אישה בכפר אישה בעיר איך בודקים השערות באמצעות מודל זה? ההוצאה לאישה ולגבר בכפר שונה. כדי לבדוק השערה זו, נבדוק אם 0= γ. במעבר מהכפר לעיר, השינוי בהוצאה של גברים ונשים שווה. כדי לבדוק השערה זו, נבדוק אם 0= 4 γ. 41

הסרת ההנחות משתנה מסביר מקרי y i = α + βx i + u i עד עכשיו הנחנו ש- x אינו משתנה מקרי. כעת נסיר את ההנחה הזו. המשמעות: אם נדגום את אותו אדם בין ימים שונים, נקבל x אחר בכל פעם. בשיטה הקודמת שמרנו את x קבוע בין המדגמים, ולכן אם משהו הזיז את y, זה היה ה- u. כעת הכל זז והדברים מסתבכים. ההבדל בין x מקרי ללא מקרי בא לידי ביטוי כשעוסקים בנושא התוחלת מדגמים. הרי היא זו שמתעסקת במה שקורה בין β = y i = β + u i את המעבר שעשינו כשההנחה היתה בפועל, במסגרתה הוצאנו את x מחוץ לתוחלת, כבר לא ניתן לעשות. בלתי תלויים E β = β + E x i x u i x i x = u,x β + E x i x E u i 0 אפשר לראות שאם x ו- u אכן בלתי תלויים, מקבלים שוב אומד חסר הטיה. אבל אם x ו- u משתנים תלויים, β הינו אומד מוטה ל- β. כש- x היה לא מקרי, זה הבטיח לנו שהם היו בלתי תלויים ובלתי מתואמים לצערנו זה כבר לא המצב. מעתה נעבור לסמן את המדגמים ב- t במקום ב- i - הסיבה היא שהמודלים בהם x מקרי הם בדרך כלל בחתך אורך. אם כך, ראינו כי בתוחלת אין בעיה. אך, מה קורה בשונות? var β = E β E β =β = E x t x u t = E x t x u t x t x x t x = E x t x בלתי תלויים u t x t x = u,x x t x E x t x E u t σ u var β = x t x,β במצב הנוכחי לא נוכל לדעת מה השונות של כיוון שאין לנו את השונות של מותנה: זוהי לא שונות אמיתית כיוון שהיא תהיה שונה בכל מדגם. תלות בין x ל- u ישנם שני סוגים של תלות בין x ל- u :.x לכן במקום זאת, מחשבים שונות תלות בין u t ל- x t )תלות בו זמנית(.1 4

תלות בין u t ל- x t-j )תלות בין דורית(. התלות מסוג )1( )תלות במונה( חמורה הרבה יותר מהתלות מסוג ( (. במקרה של תלות מכל אחד מהסוגים, שיטת אומד הריבועים הפחותים, לצערנו, תמיד תוביל אותנו לאומד מוטה. אנו צריכים למצוא שיטה כדי שהאומד לא יהיה מוטה. מודל ההתאמה החלקית כדי להבין את מודל זה, נשתמש במודל שהוא קצת מחוץ לעולם הכלכלה: מודל חקלאי. באמצעות y t נסמן מה היבול הרצוי. y t = α + βx t + u t היבול שנראה בפועל, יהיה סוג של שקלול בין היבול הרצוי ליבול שנתקבל בתקופה הקודמת. y t = δy t + 1 δ y t 1 = δ(α + βx t + u t ) + 1 δ y t 1 במודל שנתקבל, 1 t y הוא משתנה מקרי שכולל הפרעה אקראית )שכן הוא תלוי ב- y(. t 1 בין המשתנה המסביר להפרעות האקראיות, ונקבל אומד מוטה. נפשט ונעבוד עם המודל הבא: לא נוכל להפריד כאן y t = βy t 1 + u t למודל זה אנו קוראים מודל דינאמי יש בו התפתחות על ציר הזמן. נראה מה קורה כשמנסים לפתור אותו באמצעות :OLS β = y t 1y t T t= y t 1 = y t 1 βy t 1 + u t y t 1 = β + y t 1u t y t 1 במונה, אין בעיה: אין שום תלות בין הימים. הבעיה מופיעה בין המונה למכנה. נפתח את המכנה: E β = β + E y t 1u t y t 1.u t ל- y t 1 זאת כיוון שאנו מניחים שאין מתאם בין ההפרעה האקראית בין y 1 + y + y 3 + = βy 0 + u 1 + βy 1 + u + βy + u 3 + בעצם, במכנה מופיעים כל ה- u! לכן ברור כי יש מתאם בין המונה למכנה, והאומד מוטה. מעתה ועד סוף הקורס, אם יש אומד מוטה, לא נוכל למצוא אומד חסר הטיה. נוכל רק לנסות למצוא אומד מוטה פחות מה-.OLS 43

כל אחד מה- y המופיע במכנה, כולל בתוכו את כל ה- u לתקופות שקדמו לו, כל אחד מוכפל ב- β בחזקה המתאימה למספר התקופות שחוזרים אחורה. אם 1> β, ככל שמוסיפים תצפיות, כל u יקבל עוצמה הולכת ופוחתת, והמתאם בין המונה והמכנה יהיה קטן ההטיה הולכת ושואפת לאפס. אנו מאמינים שהכלכלה היא סטציונרית השינויים בה נעשים בהדרגה, ולכן, השונות נשארת קבועה לאורך התקופות. תחת הנחה זו, נוכיח כי בהכרח דרך 1.0< β <1 var y t = var βy t 1 + u t = β var y t 1 + σ cov y t 1,u t =0 u + 0 אנו רוצים שהשונות תהיה זהה בכל התקופות. לכן נסיר את סימון התקופה t. var y = σ u 1 β > 0 β < 1 תכונה זו גורמת לכך שאירוע חד פעמי דועך עם הזמן ולא גדל. דרך y t = βy t 1 + u t y t 1 = βy t + u t 1 y t = β y t + βu t 1 + u t בין y t = β 3 y t 3 + β y t + βu t 1 + u t y t = β n y t n + β n 1 u t n 1 + + β u t + βu t 1 + u t כלומר, ה- y של היום נקבע לפי y של פעם, בתוספת ההפרעות האקראיות. אם β בערך מוחלט לא יהיה קטן מאחד, ההשפעה של העבר הרחוק תהיה הרבה יותר דרמטית על ההווה מאשר אירועים אחרונים. בכל מקרה, ההוכחה הזו מביאה לנו תועלת כאשר המתאם הוא בין המונה למכנה, ואנו עדיין מניחים כי אין תלות.u ל- y 1 עקיבות נחלק את האומדים המוטים לשני סוגים: מוטה ועקיב מוטה ולא עקיב )consistent(.1. אומד עקיב אומד, כשאשר המדגם שואף לאינסוף, הוא שואף לגודל האמיתי. P θ n θ > ε = 0 n 44

עקיבות קשורה להתנהגות האומד כשמוסיפים תצפיות למדגם, ולא כאשר מוסיפים מדגמים )כי זו תהיה ההגדרה של חוסר הטיה(. תכונת העקיבות גוררת גם את התכונה הבאה: var θ n = 0 n ניתן לבדוק עקיבות גם אצל אומד שאינו מוטה. y i = α + βx i + u i האם α ו- β, אשר אינם מוטים, הם גם עקיבים? מתוך חוסר ההטיה, אנו יודעים שבין מדגמים, האומד שווה בממוצע לגודל האמיתי. מתוך עקיבות, אנו יודעים שלא קיימת שונות. חיבור שתי התכונות האלה גורר שהאומד יהיה שווה לגודל האמיתי, גם אם נבדק רק מדגם אחד )שגודלו שואף לאינסוף(. σ u var β = ככל שמוסיפים יותר תצפיות )שאינן שוות לממוצע(, השונות הולכת וקטנה. מכאן, ה- OLS הינו גם חסר הטיה, וגם עקיב. יתכן גם אומד חסר הטיה שאינו עקיב, לדוגמה: y i = βx i + u i β = y T y 1 x T x 1 = βx T + u T βx i u 1 x T x 1 = β + u T u 1 x T x 1 var β = E u T u 1 x T x 1 = 1 x T x 1 E u T u 1 = σ u x T x 1 האומד β הינו חסר הטיה אך אינו עקיב. מסקנה: אין קשר ישיר בין עקיבות לחוסר הטיה אחד עוסק בהוספת מדגמים, השני בהוספת תצפיות. מתאם בין ההפרעות האקראיות נחזיר את x להיות משתנה שאינו מקרי, ונסיר את ההנחה כי אין קשר בין ההפרעות האקראיות..ϵ y t = α + βx t + u t u t = ρu t 1 + ε t כעת כבר לא נוכל להניח שתוחלת u היא אפס אך את ההנחות הישנות על u, נוכל להניח כעת על E ε t = 0, cov ε t, ε t j = 0, var ε t = σ ε, ε t ~N ראשית נבדוק אם האומד שלנו מוטה: 45

β = x t x y t x t x = x t x α + βx t + u t x t x = β + x t x u t x t x E β = β + x t x E u t x t x u t = ρu t 1 + ε t = ρ u t + ρε t 1 + ε t = ρ 3 u t 3 + ρ ε t + ρε t 1 + ε t 1 = ρ u t + ρ i ε t i i=0 0 E u t = ρ E u t =0 1 =0 + ρ i E ε t i i=0 = 0 β אנו מאמינים שהעבר פחות דומיננטי בקביעת ההווה. לכן 1> ρ, נשאר חסר הטיה. והאיבר השמאלי שואף לאפס. בסופו של דבר, לתוחלת כפי שתיארנו כאן, קוראים תוחלת לא מותנה. עם זאת, נוכל גם לשאול מה התוחלת המותנה של u: E u t u t 1 זאת כיוון, שכשיש לנו את ה- u של אתמול, יש לנו הרבה יותר אינפורמציה לגבי הגובה של סיכוי שהתוחלת שלו תהיה 0! u של היום לכן אין כעת נבדוק מה קרה לשונות, וכדי לעשות זאת, נעשה קצת עבודת הכנה: שונות של u ומתאם בין תקופות שונות var u t = E u t E u t = E 1 i=0 ρ i ε t i E ρ 1 ε t 1 + ρ ε t = + ρ 1 ρ E ε t 1 ε t למען הפשטות, נפתח את הביטוי עבור שני גלגולים: =0 1 var u t = ρ i E ε t i i=0 =E ε t 1 E ε t 1 =σ ε 1 = σ ε ρ i i=0 = σ ε 1 ρ = var(u) קיבלנו כי יש שונות קבועה עבור כל ה- u שאינה משתנה עם התצפיות. ניתן להוכיח זאת בדרך נוספת: 46

var u t = var 1 i=0 ρ i ε t i 1 1 = ρ i var ε t i = σ ε i=0 i=0 ρ i = σ ε = var u 1 ρ אם כך, יש ל- u שונות קבועה, שאינה תלויה ב- t, והיא סופית. כעת נחשב את השונות המשותפת של ההפרעה בין שתי תקופות: cov u t, u t 1 = E u t E u t u t 1 E u t 1 אין מתאם = E ρu t 1 + ε t =E u t 1 E u t u t 1 E u t 1 = ρ cov u t 1, u t 1 = ρ var(u) המסקנה המתאם בין u של שתי תקופות עוקבות, חלש יותר מהפיזור של u. cov u t, u t = cov ρ u t + ρε t 1 + ε t, u t = ρ cov u t, u t = ρ var u והמסקנה הכללית הנגזרת: ככל ששני איברים רחוקים יותר זה מזה, כך גם הקשר ביניהם חלש יותר. cov u t, u t j = ρ j var u נחשב את מקדם המתאם: = t 1 u t, u מקדם המתאם cov u t, u t 1 var u t var u t 1 = ρ var u var u = ρ לכן גם הקשר ביניהם מסומן מלכתחילה ב- ρ! ובאופן כללי: u t, u t j = ρ j מקדם המתאם שונות של β var β = E β E β = E x t x u t x t x נפתח את המונה באמצעות שלושה איברים: E x 1 x u 1 + x x u + (x 3 x ) ρσ u = + x 1 x x x E u 1 E u 1 u E u ρ σ u + x 1 x x 3 x E u 1 E u 1 u 3 E u 3 + x x x 3 x E u E u u 3 E u 3 47

םיx יש לשים לב כי ככל שמשתמשים ביותר איברים, נמצא איברים צולבים ביניהם יש מרחק גדול יותר, כלומר, חזקות גבוהות יותר של ρ. נחזיר את המכנה, ונרכז איברים דומים: var β = var β ללא מתאם σ u x t x + ρσ u T t= x t x x t 1 x x t x x t x T + ρ σ u t=3 x t x x t x x t x x t x + + ρt 1 σ u x 1 x x T x x t x x t x + ρ3 σ u T t=4 x t x x t 3 x x t x x t x אפשר להוציא את השונות כגורם משותף: var β = σ u T t= 1 x t x + ρ x t x x t 1 x x t x x t x + ρ T t=3 x t x x t x x t x + ρ3 T t=4 x t x x t 3 x x t x x t x x t x + ρt 1 x 1 x x T x x t x x t x + עד עכשיו, היינו סופרים בשונות רק את האיבר הראשון במשוואה הנ"ל. למעשה, במידה ובמציאות היה קשר בין ה- u, היינו שוכחים כמות גדולה מאוד של איברים, ומקבלים שונות לא נכונה! עם זאת, האיברים הולכים ונחלשים )עקב החזקה ההולכת ועולה של ρ(. כעת היינו רוצים לדעת לאיזה כיוון מתכנסים האיברים הנוספים: האם השונות המקורית שחישבנו, ה"מוטעית", גדולה מהשונות האמיתית או לא? זו שאלה קריטית היא משפיעה על הקביעה האם מדובר באומד שונות מינימלית; האם מדובר באומד מוטה; היא גם משפיעה על גודל רווחי הסמך שהשתמשנו בהם. ניקח את האיבר הראשון: ρ T t= x t x x t 1 x x t x x t x T t= מקדם המתאם של x t 1,x t 1 = ρ x t x x t x x t 1 x x t x x t x מה שקובע את הכיוון של הביטוי הזה, הוא המכפלה של ρ עם מקדם המתאם של ה-. אם נדע את ρ, נוכל לחשב נכון את השונות. אבל - משפט גאוס מרקוב לא חל על האומד הזה! השונות תהיה נכונה )לא מוטית( אך לא מינימלית! כדי שמשפט גאוס מרקוב יתפוס, ה- uים חייבים להיות בלתי תלויים. כעת, נמצא אומד חסר הטיה אחר, במקום ה- OLS, שיהיה בעל שונות מינימלית. נלמד גם את מבחן דארבין ווטסון שירמז לנו אם עלינו להשתמש ב- OLS או באומד האחר. הערה: עד עתה ידענו כי: 48

σ u = u t T אך אומד זה, כאשר יש מתאם סדרתי, הוא אומד מוטה! אם במציאות קיים מתאם סדרתי אך אמדנו מודל רגיל, הוספנו טעות על טעות: גם השמטנו איברים מנוסחת השונות, וגם השונות הנאמדת של u היא מוטה. אמידת המודל בעל מתאם סדרתי כדי להגיע לשונות מינימלית, נתקן את המודל עצמו. המודל המתוקן הומצא על ידי קורקרן ואורקוט, שאמרו את הדבר הבא: קחו את המודל, והציבו לתוכו את ההפרעה האקראית.u t y t = α + βx t + u t u t = ρu t 1 + ε t y t = α + βx t + ρu t 1 + ε t u t 1 = y t 1 α βx t 1 y t = α + βx t + ρ y t 1 α βx t 1 + ε t y t = α 1 ρ + βx t βρx t 1 + ρy t 1 + ε t במודל הזה נעלמה ההפרעה הסדרתית, וקיבלנו מודל עקיב. עם זאת, את המודל הזה לא ניתן למדוד באמצעות OLS ה- OLS חייב להיות ליניארי בפרמטרים, ואילו לנו יש כפל בין β ל- ρ. ניתן לסמן,βρ=γ אך בכך אנו למעשה מסירים מגבלה מהמודל. γ חייבת להיות המכפלה של β ו- ρ, אך ברגע שאיחדנו אותם, הסרנו מהמחשב את המגבלה. למעשה, מתוך הרגרסיה לעולם לא נקבל שמכפלת האומדים של β ו- ρ שווה לאומד של γ. לכן, המודל הזה, כפי שכתוב הינו אסור לאמידה באמצעות.OLS השיטה למציאת האומדים הללו היא פשוט ניסוי וטעייה, עד שמקבלים פרמטרים המביאים למינימום את ריבועי הסטיות. זו בעיה ישנן אינסוף שלשות אפשריות, ויתכן שהסיפור בלתי פתיר. לכן בתוך המחשב מוצב גבול, הוא בוחר מספרים באופן אקראי ומשוטט מסביבים, וברגע שהוא לא מצליח לשפר את ריבועי הסטיות על ידי שינויים קלים הוא עוצר. קורקרן ואורקוט פיתחו שיטה לפתור את המודל. הם אומרים להתחיל בבחירת גודל ρ, הצבתו במודל, והרצת α.ols ו- β המתקבלים הם לא הנכונים, אלא רק אלו המתקבלים בהינתן ρ. כעת לוקחים את α ואת β, מציבים במודל, ואומדים את ρ. את ρ הנאמד מציבים בחזרה, ושוב אומדים את α ו- β. ρ 1 α 0, β 0 α, β ρ 1 ρ 3 α, β α 4, β 4 ρ 3 49

בסופו של דבר, אם ההבדל בין α 0,β 0 ל- α 4,β 4 נעשה קטן מאוד, עוצרים ומניחים ש- α ו- β כבר לא תלויים ב- ρ, ולכן הם האמיתיים. התוצאה של התהליך הזה תהיה אומדים בעלי שונות מינימלית, בהסתמך על משפט גאוס מרקוב. ב- E-VIEWS, מריצים רגרסיה על X Y, ו-( AR(1. דרבין ווטסון ישנו משתנה סטטיסטי בשם דרבין ווטסון. המשתנה הסטטיסטי הזה מודד את ρ, כשמריצים רגרסיה רגילה. DW = T t= u t u t 1 T u t t=1 1 1 = T t= u t T + T u t= t 1 t=1 u t T T t= u tu t 1 t=1 u t T t=1 u t T t=1 u t ρ הסטטיסטי הזה יהיה בקירוב בין 0 ל- 4. האיבר הזה הוא למעשה תוצאת הרגרסיה: u t = γu t 1 + ε t γ = T t= u tu t 1 T u t t= ככל שהסטטיסטי קרוב ל-, זו עדות לכך שאין מתאם. ככל שהוא קרוב ל- 4 או 0, זו עדות למתאם. את התוצאה יש לבדוק מול טבלת התפלגות דרבין ווטסון. טבלה זו היא בעייתית: ישנם תחומים מספריים בהם לא נוכל לתת הכרעה חד משמעית לכאן או לכאן ברמת ביטחון מסויימת. שיטה זו בודקת מתאם מסדר ראשון בלבד. לא ניתן להיעזר בשיטה זו מודלים הכוללים מתאם מסדר גבוה יותר, כמו.u t = ρ 1 u t 1 + ρ u t + ε t נשאלת השאלה, מדוע לא להשתמש תמיד בשיטת קורקרן ואורקוט. למעשה בשיטה זו אנו כופים על המדגם מתאם סדרתי, ועלולים לקבל תוצאות מעוותות. לכן תמיד כדאי להתחיל עם בדיקת דרבין ווטסון. משתנה מסביר מקרי יחד עם מתאם סדרתי בהפרעות y t = βy t 1 + u t u t = ρu t 1 + ε t כעת, גם המשתנה המסביר מקרי, וגם קיים מתאם סדרתי בהפרעות. β = I t= T t= y t 1 y t y t 1 = I t= y t 1 βy t 1 + u t T t= y t 1 = β + I t= y t 1 u t T t= y t 1.β כבר ראינו את זה קודם: קיים מתאם בין המונה למכנה. אך במקרה הקודם שבו ראינו את זה )משתנה מסביר לא מקרי(, לא היה מתאם בין האיברים במונה. במצב החדש, יש מתאם גם בין המונה למכנה, וגם בין האיברים במונה. הבעיה הזו גורמת לכך שגם אם נוסיף תצפיות, לא נוכל להיעזר בתכונת העקיבות. האומד הזה מוטה בכל מקרה. גם אם יהיו אינסוף מדגמים, לא נוכל לגלות את זה בגלל שאנחנו לא יודעים מי השפיע באמת על השינוי של היום, ולא נוכל להפריד בין ההשפעה של y )שהוא נצפה( להשפעה של u )שהינו בלתי נצפה(. 50

= β + I t= y t 1 (ρu t 1 + ε t ) T t= y t 1 =ρ = β + I t= y t 1 ρy t 1 T t= y t 1 = β + I t= y t 1 ρ y t 1 βy t + ε t T I t= I t= y t 1 ρβy t T t= β = I y t 1 t= T t= y t 1 y t y t 1 t= y t 1 y t 1 ρβy t T t= y t 1 0 T + I t= y t 1 ε t T t= y t 1 נביט על האיבר האמצעי: הוא די דומה ל: בייחוד כאשר אנו עוסקים בכמות אינסופית של תצפיות. נסכם מה קורה באינסוף: plim β = β + ρ plim β ρ β plim β = β + ρ 1 + βρ אם ρ היה 0,.β =β אך אם 0 ρ, המשתנה מוטה ואף אינו עקיב. אנחנו מקבלים שהקשר בין ה- y )β( תלוי בקשר בין ה- u )ρ(. שונות שונה כלומר, מצבי רוח של אנשים שונים יכולים לנוע ממרחב מדגם אחר. יתכן גם שהשונות תגדל עם הזמן, למשל, בשינוי שערי מטבע )שקל יותר או שקל פחות לא מהווים שונות גדולה, אך כשערך השקל משתנה, השונות משתנה יחד איתו(. אנחנו חוזרים להנחות הקודמות: x לא מקרי, אין מתאם בין ה- u, u מתפלג נורמלית..β הנחת ההסרה של השונות השווה לא מפריעה לחוסר ההטיה של עם זאת, בתצפיות בהן השונות גדולה, המחשב "מתאמץ" יותר למזער את הריבועים, וכך נותן יותר משקל לתצפיות אלה. המטרה שלנו תהיה לנטרל את השפעת השונות המוגדלת, ולכן נצטרך להריץ מבחן שיסייע לנו להבחין בין שונות מנופחת לשונות הגדולה באופן מקרי. E u t = 0 u t ~N 0, σ ut נבדוק את ההשפעה על β )אנו משמיטים את החותך על מנת לפשט את העבודה(: y = βx t + u t 51